PacBio HiFi测序在AAV载体测序应用 —— 全长载体基因组测序评估载体异质性和揭示载体嵌合
重组腺相关病毒(rAAVs)已成为表达治疗性基因产物中最有前途的载体之一。医学应用对临床级载体的特殊需求需要严格的质量控制 (QC) 测试,以评估载体纯度和完整性。然而,目前的标准 QC 流程主要局限于通过 qPCR 对载体进行滴度检测和定量;通过琼脂糖凝胶电泳验证基因组大小;以及通过银染聚丙烯酰胺凝胶电泳表征病毒纯度。这些方法都不能表征片段化的 AAV 基因组的组成和结构以及所占比例。最近,NGS 开始被用于分析单链(ss) AAV 的基因组,以评估 rAAV 生产过程中“容易出错”的基因组封装程度。然而 AAV 载体上的ITR 区域由于富含 GC,对 NGS 来说是一大挑战,NGS的短读长也使得其不能对 AAV 载体的单个完整分子进行检测。尽管针对 AAV 的 QC 已有10多年的历史,但目前仍然缺少有效和标准化的 QC 方法来详细表征源自包装细胞系的宿主基因组或源自 Ad-helper 和 rep/cap 构建体的病毒片段的错误包装的性质和比例。
2018年,来自美国麻省大学医学院的高光坪教授团队在 Molecular Therapy Method & Clinical Development 上发表的一篇文献,使用单分子实时 (SMRT) 测序,将包装好的基因组作为一个完整的单分子进行全面分析,并直接评估载体完整性。高教授团队通过生物信息学管道分析了自互补 AAV 基因组的所有异质群体,并开创了 AAV 基因组群体测序方法 (AAV-GPseq)。该方法可以揭示载体制剂中截短基因组与全长基因组的相对分布。发现通过凝胶电泳看似显示出高比例同质性的病毒制剂实际上仅有不到50% 的全长序列。
AAV-GPseq 可以对 AAV 基因组的 5'ITR - 3'ITR 进行单分子全长测序
为了测试 PacBio SMRT 测序是否可以对AAV载体基因组的全长进行单分子测序,研究人员使用了三个 scAAV 基因组(图1 A)。第一个是含有由鸡-β-肌动蛋白/CMV 启动子 (scAAV-EGFP) 驱动的 EGFP 转基因的常规 scAAV 载体。第二个和第三个是类似于 scAAV-EGFP,但包含 shRNA 盒,旨在敲除萤火虫荧光素酶 (FFLuc) 基因或载脂蛋白 B (ApoB) 基因(分别为 scAAV-siFFLuc 和 scAAV-shApoB-R)的表达。
图1. 通过 AAV-Gpseq 对 scAAV 基因组进行单分子分辨率分析
病毒粒子被蛋白酶水解释放基因组后,对 DNA 切口进行末端修复,接着将 SMRTbell 接头连接到载体分子开放端 ,最终生成一个环形单链 DNA 模板文库,这种结构非常适合进行 PacBio SMRT 测序(图1 B)。
经过 SMRT 测序得到的高质量线性共有序列与相应的参考序列进行比对,这些参考序列是从 5' ITR 延伸到 3' ITR 的单链线性化分子,具有突变体 ITR (mITR) 位于序列的中心 (图 2A)。在将测序reads与参考序列进行比对之后,研究人员立即发现,对于含有 shRNA 盒(scAAV-siFFLuc 和 scAAV-shApoB-R)的载体,全长序列的丰度要低得多(图 2B)。这一结果与之前的研究结果一致,即包含短发夹 DNA (shDNA) 序列会产生比单位长度更短的分子,从而导致全长分子减少。研究人员还注意到正向或反向序列以接近 1:1 的比例分布(图 2B,分别为红色和蓝色 reads)。这一观察结果也与之前的发现一致,即正(+)链和负(-)链基因组以相等的比例包装到衣壳中。
图2. 从 SMRT 测序中测到的从 5' ITR 到 3' ITR 的全长载体基因组
AAV-GPseq 使研究人员能够直接识别和量化 rAAV 制剂中封装的正/负链和 flip/flop 的分布。通过测序结果可以观察到所有三个 scAAV 载体的 flip/flop 分布比率都接近 2.3:1:1:2.3(图 2C)。
AAV-GPseq 可以评估载体基因组异质性的相对丰度
按序列长度对 scAAV-EGFP、scAAV-siFFLuc 和 scAAV-shApoB-R 载体进行的初步分析显示,与之前通过溴化乙锭 (EtBr) 染色的琼脂糖凝胶检测到的异质基因组观察到的相关性较弱(图 3)。通过 AAV-GPseq 能够计算全长分子与截断分子的相对丰度。通过在它们各自的丰度轨迹上叠加适当的载体基因组图,研究人员还可以预测分子内链转换事件的热点,这会产生这些截短的产物(图 3,右图)。令人惊讶的是,即使琼脂糖凝胶分析表明 scAAV-EGFP 全长物种(2.1-kb 条带)是主要的包装载体(图 3A),在经过AAV-GPseq 测序后,结果表明 2.1-kb 分子形式仅构成45.39% 的载体映射reads。同样,scAAV-siFFLuc 和 scAAV-shApoB-R 载体也导致全长物种的百分比极低(分别为 7.55% 和 11.91%)(图 3B 和 3C)。
图3. 异质 AAV 基因组群的丰度评估
AAV-GPseq 揭示了携带质粒骨架序列的载体群体
研究人员接下来评估了整个载体质粒的读取覆盖率,以评估 PacBio SMRT 测序检测包含 ITR 以外区域的基因组包装的能力(即质粒骨架序列)。理论上每个 scAAV 分子实际上是一个线性自互补序列在载体基因组的开放末端有两个 ITR,只有一半的分子会与载体参考序列正确映射,而另一条互补链则不应该有映射。但是通过测序还是能够发现有少数reads会映射到 pCis 质粒参考序列上(图4),这意味着不光是包含 AAV ITR 的载体可以包装到病毒衣壳中,质粒也有可能被包装到衣壳中。
图4. 异质载体群与 pCis 质粒参考的比对
对 AAV 载体基因组嵌合的检测和表征
尽管在 rAAV 纯化过程中进行了广泛的 Benzonase 核酸酶处理,然后在提取病毒 DNA 之前进行了 DNaseI 处理,但仍然不能排除污染 DNA 作为包装的非载体序列的来源。然而,需要注意的是,载体基因组包装依赖于对 AAV-ITR 中 Rep 结合元件 (RBE) 的识别。此外,将随机序列被打包到 AAV 中还有待正式证明。因此,对于非载体序列的封装有两种可能的解释:(1) AAV-GPseq 检测到的污染序列具有 RBE 样基序,或 (2) 载体基因组与宿主基因组序列重组产生嵌合载体基因组。在研究这两种可能性后,研究人员发现映射到 hg38 的大部分序列也映射到了载体基因组。这一发现揭示了一类被包装到 rAAV 颗粒中的嵌合基因组。重要的是,这些嵌合序列都包含 ITR 序列,支持这样的假设,即宿主基因组序列可以通过识别在生产过程中与 ITR 序列重组获得的 RBE 序列被包装到衣壳中。令人惊讶的是,研究人员观察到嵌合序列并没有随机映射到构建区域。相反,它们富含转基因启动子序列(图5)。
图5. 测序reads映射到 Ad-helper 质粒和 AAV-Rep/Cap 质粒的比对数据
利用 AAV-GPseq 可以评估完整的载体基因组序列,以表征单个嵌合分子的组成。当映射到人类基因组时,研究人员发现在映射到 16 号染色体的 13 个嵌合 reads 中,有 6 个嵌合体映射两次,一个嵌合体映射四次到相同的基因组位置。对归因于嵌合体以及仅映射到人类基因组的读数的分析表明,外源 DNA 可以包装为类似于 scAAV 的自我互补序列(图6)。
图6. 外源 DNA 可以包装为类似于 scAAV 的自我互补序列
总结
高光坪教授团队利用 PacBio SMRT 测序成功地对 rAAV 载体的基因组进行了全长单分子测序,并开创了 AAV-GPseq 测序,观察到了很多之前由于技术限制无法观察到的 rAAV 载体基因组的详细情况,例如对载体基因组异质性的全面评估、观察到质粒序列和存在宿主基因嵌合的现象。PacBio 在2019年推出了更加精准的 HiFi 测序模式,在兼顾长读长的同时把测序准确率提升到Q30(99.9%)以上,能够更好地表征 AAV 载体上的各种序列以及载体分子的群体分布,填补了之前技术的空白,是一种应用于 AAV 载体研发和基因治疗制剂 QC 的利器。
PacBio将在5月31号晚7:30-8:30举办 PacBio HiFi测序在AAV载体测序及基因治疗中的应用在线研讨会,可扫描下方二维码报名参会。
PacBio SMRT测序只应用于科研,不用于临床。
—END—
往期文章推荐:
两款CAR-T细胞基因疗法纳入“沪惠保”,已开启线上预约投保
目前国内获批或申请已被受理的AAV基因疗法临床试验已达20项